溫沙拉起源於法語"Salade Tiede",溫沙拉就是所謂的溫熱吃的沙拉,以溫熱的醬汁搭配熟成後的肉類蔬食來搭配生菜烹調。與一般沙拉不同的地方在於,溫沙拉的本質並未從沙拉做改變,而是在既有的內容上做更多的調理,在原先單調的味覺中,帶來更多色彩。溫沙拉章節主要要說明的是樞紐分析表 Pivot_Table,代表著我們在原先的資料集上做了更多元的分析。
這篇文章的目的是讓你對一些交互式的 python 工具有一個基本了解,以及你如何使用這些工具以一種非常快速和可重複的方式進行一些複雜的分析。我計劃花時間說明這樣的例子,以顯示這個工具集有多麼有用,並繼續讓人們知道,當涉及到復雜的數據分析時,除了 Excel 外 Python 也是一個選擇。我們將銷售資料匯入進行樞紐分析,再將樞紐分析結果匯回 Excel 檔案。
dt=pd.read_csv("data/df-sample-sales.csv")
dt.head()
實際上,我們可以從 describe 命令中了解到一些相當有用的信息。
dt.describe()
Pandas在處理大量數據並將其總結為多種文本和視覺表現形式方面非常出色。不費吹灰之力 Pandas 就支持輸出到CSV、Excel、HTML、json等不同格式了。之前關於 Pandas 數據透視表的文章和關於表格生成 Excel 報告的文章。它們解釋了使用的數據集以及如何使用數據透視表。
report = dt.pivot_table(index=['Account Name'], # Rows
columns=['category'], # Cols
values=['quantity'], # Values
fill_value=0, # fill NaN To 0
aggfunc=np.sum) # Values summarize by SUM
report.head(10)
根據我們的需求我們能夠選擇我們想要進行的 Rows 與 Cols 數據,這些數據我們可以決定要怎麼進行調整或是 fill_value。
report = dt.pivot_table(index=['Account Name'],
columns=['category'],
values=['ext price','quantity'],
fill_value=0,
aggfunc=np.sum)
report.head()
或者是說我們可以將它輸出表格為報表,利用 .to_excel() 的方式,都要找到方法來處理,由此方法我們可以把預期的內容給輸出出來。
report.to_excel('data/df-sample-sales-out.xlsx', sheet_name='Sheet1')
今年沒組團,每一筆一字矢志不渝的獻身精神都是為歷史書寫下新頁,有空的話可以走走逛逛我們去年寫的文章。
Jerry 據說是個僅佔人口的 4% 人口的 INFP 理想主義者,總是從最壞的生活中尋找最好的一面,想方設法讓世界更好,內心的火焰和熱情可以光芒四射,畢業後把人生暫停了半年,緩下腳步的同時找了份跨領域工作。偶而散步、愛跟小動物玩耍。曾立過很多志,最近是希望當一個有夢想的人。
謝謝你的時間「訂閱,追蹤和留言」都是陪伴我走過 30 天鐵人賽的精神糧食。